Mapreduce相关论文
【目的】从海洋平台数据中过滤出用户需要的信息,并及时准确地推荐给用户。【方法】通过基于内容的推荐算法和基于物品的协同过滤......
本文针对如何快速进行处理HBase表中数据的问题,提出了使用MapReduce并行处理HBase表中数据的关键技术,可利用集群资源,达到快速批......
随着信息时代的到来和计算机技术的发展,各行各业的数据呈指数型增长。同时,大数据的快速发展在无时无刻影响着人们的生活。而对大数......
为了提升信息加密密钥敏感性以及加密加速比,提出基于大数据技术的智慧后勤信息动态加密方法.基于分层规划理念构建智慧后勤信息化......
面对传统医疗健康管理系统在存储和管理海量数据方面表现欠佳的问题,提出基于Hadoop对医疗健康数据进行高效管理和快速处理的方法。......
为了有效提高非结构化数据处理的效率,本研究围绕MapReduce框架、Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)、Hado......
为了提高用户获取图书的效率、优化阅读体验,文中对基于用户行为与内容的相关推荐算法进行了研究,引入Hadoop大数据处理框架,设计并实......
21世纪信息化大数据时代的到来,数据已经成为了每个行业和领域不可缺少的组成部分,尤其是文本类型的数据。各个行业每天都在产生与......
大数据、云计算技术的迅猛发展为挖掘气象数据丰富的科研和经济价值提供了技术支撑,促进了Hadoop及其包含的文件存储系统(HDFS,hadoo......
随着太空领域研究和大数据技术的发展,空间环境数据持续大规模增长。如何利用、分析及整合这些数据成为当前太空战场环境分析技术......
For the efficiency of image processing in traditional single-machine environment is low, and the image processing used H......
随着信息技术的快速迭代与发展,各行各业产生了规模庞大、结构复杂、种类繁多的数据。从未知的数据中获取有实际应用价值的信息,是......
大数据、云计算技术的迅猛发展为挖掘气象数据丰富的科研和经济价值提供了技术支撑,促进了Hadoop及其包含的文件存储系统(HDFS,Hadoop......
研究了HBase存储机制,针对现有存储查询方法效率低等缺陷,设计了HBase矢量空间数据存储表模式,如行键、过滤列族、几何列族及非几何列......
伴随着信息技术以及各种互联网企业的迅猛发展,面对爆炸的数据以及种类繁多的新业务,传统老旧的运维方式已经不能满足一个大型企业......
数据安全性、隐私性、信任度等广泛存在于生物工程、智能制造、现代农业、智慧医疗和公共安全等诸多领域,面向飞速增长的大数据,如......
随着网络技术的快速发展,每时每刻都有大规模的数据产生,Hadoop平台的主要部分之一—MapReduce对于处理这些数据具有重要作用。在M......
国家素质教育的口号提出已久,各行业对人才的需求也不仅仅停留在学术的层面,良好的价值观,基本的做人素养以及体质健康状况等都作......
MapReduce是一种常用的大规模分布式计算范型。在其Shuffle阶段时,计算节点间需要相互交换大量中间结果,从而导致高额通信负载,且......
数据挖掘是通过机器学习、模式识别和数理统计等方法获取有用信息的一种重要技术手段,可以广泛应用于社交网络、医疗和市场分析等......
随着信息技术的飞速发展与互联网的普及,网络用户更加热衷于在互联网上发表自己的观点、态度,各类网络平台上积蓄着用户大量的评论......
BP神经网络(BPNN)被广泛称为现阶段最受欢迎的神经网络之一,它是一种监督式学习的网络[1]。BPNN通过学习训练样本输入和输出的关系进......
Hive是一种建立在Hadoop上的数据仓库基础构架.Hive系统结构中的解析器,可以将用户编写的HiveQL语句进行解析,解析出相应的MapRedu......
数据迁移是指将数据从一个存储系统传输到另一个存储系统的过程,包括对数据的选择、提取、转换等。现有的数据迁移技术大多针对某......
网络中大部分数据以文本形式存在,亟须在MapReduce环境下布局一种分布式云计算数据挖掘方法,解决大规模文本的分类挖掘问题.此次研......
为了提高对智能电网大数据的挖掘效率,提出了基于PCA-MP-BP的智能电网数据融合方法.首先对智能电网大数据技术和智能电网大数据融......
为了提高Hive的查询性能,对HDFS数据块放置策略进行了优化,提出了一种基于相关关系分析的数据块放置策略,通过构建并发关系矩阵和......
随着互联网、云计算、物联网、大数据、人工智能、5G网络等技术的飞速发展,数据成指数幂增长,微博数据暴增,这些数据表现的信息中......
随着信息技术的快速发展,大数据正以成倍的形势增长。数据也越来越呈现出数量巨大、结构复杂、类型众多、富有价值等特点。然而挖......
目前电力大数据的质量不高,提高电力大数据的质量有利于提高电网智能化水平。根据对电力系统数据质量评估流程及架构的分析,提出了......
随着我国经济的发展,物流服务交易量也越来越大。当前,物流交易存在的问题主要有:信任缺失、缺乏自动化和智能化等。由于区块链具......
智能云计算是下一代智能作战装备的发展趋势,本文针对军事应用场景下的高实时性要求,介绍一种嵌入式智能云计算平台.该系统基于ARM......
随着大数据时代的到来,数据存储量已从常见的TB上升为NB,1NB为260TB,在大数据商业价值备受关注的今天,海量数据的挖掘、分析、存储......
随着物联网技术的发展,越来越多的传感器、移动终端和计算机通过网络联系在一起。物联网传感器已经作为基础装备应用到电力系统、......
随着互联网大数据的普及,云计算作为一种多技术的集成创新,企业和个人越来越愿意应用各种便捷高效的云服务进行海量数据存储和共享......
随着数据分析和处理任务的规模越来越大,加速计算进程的需求也急剧增大。分布式计算是一种相对于集中式计算的计算方法,它将计算任......
水环境模型内部结构复杂且计算耗时,造成参数率定、多情景分析及决策优化过程中面临高负荷计算难题,这极大地限制了其应用价值的发......
A Distributed Framework for Large-scale Protein-protein Interaction Data Analysis and Prediction Usi
Protein-protein interactions are of great significance for human to understand the functional mechanisms of proteins. Wi......
随着信息化建设的快速发展和电信运营商ICT的快速融合,流量需求迅猛增长,运营商网络中积累了大量的软硬件资源,包括交换机、路由器......
针对大数据背景下地理标志大米产地真伪鉴别的算法模型与实现技术,以大米中矿物质元素含量数据为基础,运用Hadoop分布式集群技术,......
...
...
...
随着计算机技术的飞速发展,各行各业的数据以指数形式爆炸式增长。大数据时代已经来临,给互联网行业带了巨大的机遇与挑战。一方面......